查看原文
其他

开始第一份数据科学工作之前,如何获得数据科学相关经验?

过儿 大数据应用 2022-10-18

今日份知识你摄入了么?

数据科学职业生涯中最困难的部分无疑是刚开始的时候,获得你的第一份数据科学工作是个不小的成就,如果你的名字后面没有博士头衔,那就更难了。


如果你在网上寻找入门级的数据科学工作,你会发现几乎所有工作都有很高的要求,这可能会让你感到沮丧。似乎你看到的每个职位描述要么要求有博士学位要么至少有3年机器学习经验。这就引出了一个问题:“如果没有数据科学家的经验,你怎么能胜任数据科学家的工作?”成千上万的人在网上或大学里学习数据科学课程,这些课程对培养技能很重要,但它们不会成为求职者被选中从事数据科学工作的理由。进入数据科学领域并没有单一的方法,但我想分享一些我为获得理想工作所做的经验准备。

无论你是一名即将毕业的学生还是一名想要进入数据科学领域的学生,都有很多方法可以获得数据科学方面的经验。


获得经验的方法:做研究


找机会与大佬在学术论文上合作是一个很好的机会,这样可以获得数据科学的几个重要领域的经验。做研究的缺点是,它通常薪酬不高,并不涉及机器学习之类的东西。尽管如此,我还是强烈建议你找机会做一些研究来完善你的数据科学简历。


为什么这是一次很好的经历


做研究看起来很有吸引力有两个主要原因。首先是处理数据的机会,由于研究的性质,有机会参与数据科学的整个周期。其中一些内容,比如数据收集,可能并不适用于你未来的职业。其他部分,比如分析和口译也是很有价值的技能。


我想在此强调,“能够解释数据并在分析的基础上得出有用结论的价值”,是一项重要的技能,但有时会被忽视,因为它很难作为一项技术技能进行测试。知道如何解释结果是数据科学家和可以键入“from sklearn.ensemble import RandomForestRegressor”的人之间的区别。从事学术研究要求你仅仅根据数据得出结论。同理,你必须根据你的结论来帮助公司做出决策。


研究也给了你学习如何进行实验的机会。你对实验的影响程度取决于你和谁一起工作以及有多少人一起完成一篇论文。提出一个好问题,然后做一个实验来回答它,这几乎是每一篇学术论文的基础。这种技能可以很好地转化为数据科学领域的经验。在数据科学家的日常工作中,你需要提出好的问题,并使用机器学习建立实验来回答这些问题。获得能帮助推动研究的经验,可以帮助你成为一名数据科学家,可以自主有效地工作,无需别人告诉你要解决什么或如何解决它。


怎么做


对于学生和职场人士来说,寻找研究机会需要不同的方法,我在这两个阶段都做得很成功。找到一个正在做你所感兴趣的研究的人是很重要的,把你的兴趣扩展到机器学习之外,因为研究机器学习的人比研究其他学科的人要少得多。一旦你确定了你想学习什么,把有相关兴趣的人列在一起,这就是学生和职场人士的不同之处。


如果你是在校生,我建议你着眼于你的学校方面的支持。你应该很容易找到一个研究助理的职位,可以为你做研究提供报酬。但这并不意味着你不应该去和那些不登招聘广告的教授交谈。仅仅是潜入一个有50名研究助理的实验室并不能给你和教授一对一做研究一样的经验。


如果你已经毕业,去联系任何你想联系的人。发送电子邮件,解释你是谁,为什么你对他们的研究感兴趣,以及你想如何帮助他们。我与全国各地的教授远程合作,为研究做出贡献。对每个人来说,最重要的部分是找到合适的人选,找到你感兴趣的研究,你就能为之做出重大贡献。


重写你的工作描述


在我找到全职工作之前,这是让我得到关注的最大帮助。秘诀是,你不必把数据科学家作为一个头衔来做数据科学。无论你现在在哪里工作,是实习还是全职工作,找个机会尝试一下机器学习。如果你用一种聪明的方式去做,没有人会因为你失败而生气,如果你成功了,还可以交到很多朋友。最重要的是,你将获得一些真实的数据科学经验。


为什么这是很好的体验


没有比在数据科学领域工作更好的经验了。如果你能找到一种方法在你目前的职位上从事数据科学,那基本上就和从事数据科学工作是一样的。如果你能证明你在任何地方用机器学习解决了一个问题,没有人会关心你的职位是什么,他们会想了解关于那个项目的情况。


这是好的经验的另一个原因是它显示了创造力和解决问题的能力。不会有人告诉你用机器学习做什么或者如何解决问题。与通过研究获得的经验类似,你可以证明你能够创造性地和自主地识别和解决问题。

 

怎么做


你如何去做这件事在很大程度上取决于你在哪里工作以及你的Manager是谁。所以,我不会向你展示如何在工作中进行机器学习项目的路线图,我只会告诉你我是如何做到的,并给你一些建议。


大三的暑期,我被聘为分析实习生。我真的很想在数据科学领域实习,但没有资格。我以为我只接受了一份分析实习,在那里我能预想到的最好的情况是整个夏天都在计算p值。我被分配了一个研究销售趋势的项目,在实习的前4-5周,我清理数据,分析趋势,然后我发现到我的项目已经提前完成了。我决定继续前进,尝试从数据中获得的一些机器学习技能,看看我是否能发现比趋势更好的东西。两周后,我去找我的经理,告诉她我在做什么,并给她看了我的工作。对我来说,这是一份很好的实习机会,公司也得到了比原先预期的多得多的东西。


下面是我的一些心得和建议:


  • 确保你没有为了做自己想做的事而拖延本职工作。

  • 确保你的经理同意你的做法。

  • 找一个能为公司增值的问题,而不仅仅是将公司作为你个人的机器学习游乐场。

  • 如果你第一次尝试失败了,不要放弃,想办法做你喜欢做的事。


做个人项目


在你的脑海里从事数据科学项目已经被一遍又一遍地宣传,而且感觉有点陈词滥调。这确实陈词滥调,因为这是事实。自己做一些很酷的事情可以显示出你处理可能来自任何地方的数据的热情和能力。它与Kaggle或学校项目有不同的感觉,对你来说是非常好的体验。


为什么这是一次很好的经历


最好的员工是那些做着自己喜欢的事的人,雇主希望雇佣喜欢解决难题的数据科学家。只有那些真正热爱编程和构建机器学习模型的人才会疯狂地把业余时间花在编程和构建机器学习模型上。如果做个人项目对你来说是件苦差事,而你只是为了找份工作而做,那么你可能要重新考虑一下了。如果你确实喜欢做小项目,并建立了一个不错的作品集,这就向你潜在雇主展示了你的动力和能力。


个人项目也是展示技能的好方法你应该一直努力学习新技能,根据你所学的东西来做一个项目,既可以巩固你的学习成果,也可以向别人展示你的能力。做的项目越多,你的技能就会提高,你就能做更多让人印象深刻的事情来增加你的作品集。然后,你可以把你的GitHub添加到你的简历中,并让它作为一个微型技术简历来支持你的其他经验!


怎么做


开始一个项目是最困难的部分,我只讲几个我认为很重要的关键点。


当你在做一个项目时,有3个主要部分。你拥有数据、建模和结果。首先,找到你感兴趣的数据,试着去寻找那些没有在其他上百万个项目中使用过的数据,这些数据可能包含一些独特的见解。尽量避免模仿别人之前做过的项目,找到数据后,构建并评估几个模型来回答你的问题,然后用一种有趣的方式展示你的研究结果。这可以通过一篇博客文章,一个漂亮的幻灯片展示,以一种美好的、可理解的方式展示你的项目与做一些很酷的事情同样重要。


展示你的经验


在你做了所有这些事情来获得一些数据科学经验之后,你还需要好好展示出来获得一份工作。不管你在做什么,你都可以让它听起来绝对无聊,或者有趣而独特。我们以LinkedIn个人资料为例,你决定和一位教授一起做一些关于防晒霜是否能预防皮肤癌的研究,并发表了一篇很酷的论文。现在你想把它放到你的LinkedIn资料里,你可以这样写:


我帮助进行了关于防晒霜预防皮肤癌效果的研究。我帮助分析数据,并写了一篇论文,现在发表在《美国防晒霜杂志》上。


这是你在领英上写的内容,但这可能不会让人眼前一亮,想要成为一名数据科学家。有同样经验的、想找数据科学工作的人,可能会这样写:


研究助理


作为一名研究助理,我合作制定并测试了有关防晒霜和皮肤癌的假设,积极参与准备数据和解释线性回归的结果,并以一种没有统计学背景的学者都能理解研究中最重要的发现的方式展示我的研究结果,我会从这次经历中吸取实验思维,并将其应用到有关数据科学的问题上。


显然,这并不是你能写出来的最完美的版本。但我想说的是:如果你做了一些你觉得能为你成为一名数据科学家做更多准备的事情,不要羞于写出来。你必须明确表明,你有意地寻找了能让你成为一名优秀数据科学家的经历,并且做的很好。


最终的想法


在你的第一份工作之前,有很多方法可以获得数据科学方面的经验。不要觉得受限于课堂项目和Kaggle比赛。发挥你的创造力,用你感兴趣的数据技能做一些有趣的事情。一旦你获得了这些经验,请展示出来。不要害怕去申请一份需要一两年经验的工作,因为你已经拥有了这些经验。


如果你有任何问题,欢迎评论区留言!

原文作者:Nelson Griffiths

翻译作者:过儿

美工编辑:过儿

校对审稿:Dongdong

原文链接:https://towardsdatascience.com/how-to-gain-data-science-experience-before-your-first-data-science-job-88bed5f9fee3


往期精彩回顾


三个月如何搞定机器学习的数学原理?

2021北美数据求职必学必会的9门课程(系列31)限时免费!从今天学起~

自然语言处理你需要掌握的全部知识,我们用7节免费课程给你整理好啦!

如何在远程面试中谈判薪资?

世界首富创立的14条领导力准则,都讲了什么?




点「在看」的人都变好看了哦

点击“阅读原文”查看数据应用学院核心课

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存